Magic number,即
幻数,它可以用来标记文件或者协议的格式,很多文件都有幻数标志来表明该文件的格式。
计算机中的含义
rar压缩档文件的开头有[
Rar]三个字符,
zip文档开头为[PK] (源于ZIP之父 Phil Katz 名字的首字母)
可以用记事本(或者
Ultra Edit)直接打开以上文件类型的文件,查看开头的
幻数。
一般而言,
硬盘数据恢复软件(如
EasyRecovery),就是靠分析磁盘上的原始数据,然后根据文件
幻数来试图匹配文件格式,从而尝试识别出磁盘中那些已经从文件系统登记表中删除的文件(真实的文件内容可能没有被覆盖)。但是这种方法不是100%精确,因为磁盘中数据的
随机性也很大,很多没有意义的字符串,可能被误认为是有效的幻数,从而造成恢复出无效/错误的文件。
(可以在
EasyRecovery中自己定义文件的幻数然后让它帮你恢复,不过常用的文件格式它都有记录)
通常在应用开发中,文件读写也可能使用文件的幻数。例如读取文件时,用它来判断文件的格式是否匹配.如果不匹配则报告错误不处理文件,或者尝试读取文件的幻数标记来识别。
常见的例子。例如,把一个
bmp图像文件的扩展名改名为png,可能有些图像浏览/编辑软件提示:类型错误,加载失败,但是有的软件却可以识别并读出,并提示格式跟扩展名不匹配。
程序开发含义
在源代码编写中,有这么一种情况:编码者在写源代码的时候,使用了一个数字,比如0x2123,0.021f等,他当时是明白这个数字的意思的,但是别的程序员看他的代码,可能很难理解,甚至,过了一段时间,代码的作者自己再看代码的时候也忘记了这个数字代表的含义。于是感叹,
虽然不知道这个数字是干什么用的,究竟代表什么,但是编译后的程序可以正常运行,真是“魔术般的数字”
幻数的这个含义跟上一个不同,这个通常含贬义。因为在编程中使用幻数是不好的习惯,开发中应当尽量避免。
幻数的两大弊端:
一、代码可读性差,例如
如果没有说明,很难猜到那个2.13f的含义,假如它代表加速度,那么修改如下:
这样对于代码阅读者来说更好理解。
二、修改不方便,例如
暂且不说0xFFFFFFFF代表的含义,如果程序中很多地方使用了统一的一个
常量,如果要修改值的时候很麻烦,也容易出错。可能有遗漏等等诸多问题。
同样可以改为如下:
这样程序代码不仅便于阅读,而且要替换他的值,只需要替换一次就好了。
解决
魔术数字的方法主要是将这些数字定义为
常量,或者枚举类型,或者使用
编译器的
宏定义(如C/C++的
#define)
魔术数字在程序开发中还有一个用途(这个时候它是中性词),就是作为调试符号,便于观察和
调试程序中出现的错误。
举一个常见例子,windows下的程序员在调试程序时候,如果报错,可能对如下数字(地址)比较熟悉:0xcdcd,0xcccc等。
0xcdcd 是微软的C++ Debug
运行库 为没有初始化的
堆内存所做的标记,例如malloc分配出的内存,其内容可能全部都是0xcdcd。由于0xcdcd的编码,解释为中文的话为“屯”,所以windows下的程序员,windows用户应该对“屯屯屯屯屯屯”这样的字符串并不陌生。
0xcccc同样是微软的运行库为未初始化的栈空间所做的调试标记。
类似的还有 0xFDFDFD,0xFEEEFEEE,0xDEADDEAD,0xABABABAB
这些都是微软用到的
幻数,在
win32下
程序调试的可以参考,但是不能在程序开发的代码中使用,原因很简单,这个跟平台,运行库和编译模式有很大关系,只是为了调试所设置的标记,仅此而已。
其它平台也有很多幻数,例如著名的0xDEADBEEF (dead beef)
如果自己需要编写
内存管理模块,使用自己的幻数也可以很方便的做为调试所用。